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Beschreibung 

Mittels Homologiesuche in Datenbanken wurde ein Teil eines potentieilen neuen Genes welches fur einen G-Protein- 
gekoppelten Rezeptor kodiert identifiziert Aus der Partialsequenz wurden Oligonukleotid-Primer abgeleitet und fiir eine 
5 PGR Amplifikation eingesetzt. Mittels dieser Primer und der Polymerasekettenreaktion konnten wir das Rezptorgen aus 
genomischer humaner DNA amplifizieren und mit dieser Methode konnten wir auch die cDNA welche fiir diesen Re- 
zeptor kodier aus humaner Gehirn cDNA amplifizieren. Es handelt sich um ein Intron-loses Gen, d. h. die genomische 
Sequenz und die cDNA sind identisch. Ferner konnten wir auf genomischer DNA zusatzlich 5' und 3' nicht translatierte 
Bereiche des Gens (mittels genome walking) identifizieren und sequenzieren. Dargestellt und beschrieben werden das 
10 humane Gen fur den von uns als SERALPHA bezeichneten neuen Neurotransmitter Rezeptor, die cDNA welche den Re- 
zeptor kodiert und die von der cDNA abgeleitete Aminosauresequenz. Aufgrund der cDNA Amplifikation aus humaner 
Gehirn cDNA wissen wir ferner, daB dieser neue, bisher unbekannte Rezeptor im memschlichen Gehirn exprimiert wird. 

1. Das Gen inclusive 5'und 3'nichttranslatiertem Bereich welches wir zur Patentierung anmelden, ist 4260 Basen 
15 groB. Der kodierende Bereich erstreckt sich von Base 1317 (Start Codon ATG) bis Base 2843 (Stop Codon TGA in- 

clusive). Im nicht translatierten 5* Bereich (Base 1-1316) befindet sich der regulative Bereich dieses Gens (Promo- 
tor) eine TATA Box befindet sich im Bereich von 699-713. Im nichttranslatierten 3' Bereich des Gens (Base 2841 
bis 4260) befindet sich ein klassisches Polyadenylierungssignal bei Position 4169^4174 (AATAAA), auBerdem fin- 
ded man mehrere putative Polyadenylierungssignale schon weiter 3' gelegen. 
20 2. Die cDNA welche wir aus humaner Gehirn cDNA amplifizieren konnten erstreckt sich von Position 1300 bis 

2863 des Gens und kodiert fur ein Protein mit 508 Aminosauren. Fiir die Amplifikation wurden folgende Primer be- 
nutzt: sense: 5'GCCCTCTGGCTGTTGCCATG3' ;antisense: 5'GGTTTGCCTTAG AACTAACTTC3 Durch die 
Klonierung der cDNA aus humanem Gehirn ist bewiesen, daB dieser Rezeptor existiert und in menschlichem Ge- 
hirn exprimiert wird. 

25 3 . Die Aminosauresequenz welche aus dem offenen Leseraster der cDNA und auch des intronlosen Gens abgeleitet 

werden kann ist 508 Aminosauren lang. Homologievergleiche in Datenbanken ergibt, daB das Protein die hochste 
Homologie zu Neurotransmitter Rezeptoren aufweist. Die hochsten Homologien wurden zum humanen Serotonin 
1 A Rezeptor, zum muskarinischen Acetylcholin Rezeptoren (M4) und zu adrenergen Rezeptoren (alpha 1 A und 1G) 
gefunden. Hydrophobizitatsanalyse der Aminosauresequenz mit dem Programm TOPPRED2 ergab, daB das Protein 

30 die typische Struktur von G-Protein gekoppelten Rezeptoren mit sieben transmembranalen Domanen besitzt. Aus- 

serdem wurde in der Sequenz ein typischen Motiv fiir G-Protein gekoppelte Rezeptoren (Aminosaure 117-133: 
ASVNTIVVVSVDRYLSI) gefunden. Im N-terminalen Bereich des Rezeptor der vermutlich (wie bei alien G-Pro- 
tein gekoppelten Rezeptoren) extrazellular liegt befinden sich zwei potentielle N-Glykosylierungsstellen (Pos. 7 
und 13). Zwischen transmembranaler Domane 5 und 6 befindet sich eine groBe intrazellulare Schleife aus fast 200 

35 Aminosauren. Potentielle Phosphorylierungsstellen fur Protein-Kinase C befinden sich in den intrazellularen Posi- 

tionen: 66; 144; 283; 324; 331; 379; 460. An den Positionen 233 und 283 kann potentiell durch cAMP und cGMP- 
abhangige Protein-Kinasen phosphoryliert werden. 

4. Einordnung und potentielle Funktionen des zu patentierenden Rezeptors und seines Gens (bzw cDNA; mRNA) 

40 

Der Rezeptor gehort hochstwahrscheinlich zur groBen Genfamile der G-Protein-gekoppleten Rezeptoren (GPGRs). 
Innerhalb dieser GroBfamile zahlt er zur Sub-Famile der "Klasse A Rhodopsin-ahnlichen" Rezeptoren. Er besitzt hohe 
Homologie zu Rezeptoren fur Neurotransmitter (besonders fur Serotonin, Adrenalin/Noradrenalin, Acetylcholin und 
Doparnin). Aufgrund dieser Homologien und weil der Rezeptor im menschlichen Gehirn exprimiert wird, handelt es sich 

45 hochstwahrscheinlich um einen wichtigen, bisher unbekannten neuen Neurotransmitter-Rezeptor. Neurotransmitter-Re- 
zeptoren vermitteln Signale nachdem ein Neurotransmitter an einer chemischen Synapse ausgeschuttet wurde. Der ent- 
sprechende Neurotransmitter kann dann an der postsynaptischen Membran iiber Rezeptorenn das Signal weiterleitenv 
(second messenger Kaskade) und er kann auf der prasynaptischen Membran iiber Autorezeptoren seine eigene Freiset- 
zung modulieren. Fast alle bekannten Neurotransmitter Rezeptoren stellen wichtige Angriffspunkte fur therapeutisch be- 

50 deutsame Pharmaka dar. Das trifft auch fur den von uns neu gefundenen Rezeptor potentiell zu. 
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MBHB-Rezept-7 : SERALPHA: Gensequenz 



10 20 30 40 50 

I I I I I 

1 GAAAAACCAAGGTGAGGGGCCATGGGAAAAAGATGTAGAGAAATAGAGAT 
5 1 GCGCACACACTCAAAGATACAAAGCAAGTGTTTAGCCAGAGTCCTGGGGT 
101 GACAGGAAAGTGAAGGACAGAGAAACCAACGAGAGAGTGCACACACTAAA 
151 GAGATAGCTTGAGAGACAGGTGAGACAAGCAGTAGAGTGTTAGAGATCAA 
201 TGGAGAGAGAGGCAGAGTAATGCAGAGAGAACTTAGGCAGGGAGAGACAG 
251 AAAC CACAC GGAGAGACAC AG AGAC AAGAGGG T CCGAG AAAGACAGAG CA 
301 AGCG CACAC GT GCCAGT GAGAGAC AGAAGG AG AC ACCC AG AGAAC CCGAG 
351 GGAGAC GCAGAAACAAG AG AGT T GGAGAGAC ACGGAGAC GGGCAGAGACA 
4 01 CAGCGAACGACATTGAACAGGTGCGCTAGGGACCCACAAAGATGAACTGC 
4 51 TGGGGAAATAGACTGAGAGAGAAATGGAGAGACAAGAGAGCACTAGGGAA 
501 AGAC GGAGAC AC AC AT GAACT AGC GAGC GAC AC AGT G ACAGGCAGAGACA 
551 CAGAGAGACAGAATGGATCAGAAAGAGACTGAGGGAGAGACGGGCAAGAC 
601 TGTGAGAAAGATAGGGAGCGAGAGCGCAAGCCCTGCAGAGAAAGTGCGCT 
651 AGCGAAAGAGAC ACACAC AG AGAGACT G AGTGACAAAC AGAG T GG AAG AG 
701 ATAAATGAGAGTAACAGGAAAGAGACAGCGTGCACGTGCTATCGAGAGAC 
751 GGAGAAACAGAGACAGACAT AAGTGAGAGACAAGGATGAGAAAGAATCAG 
801 G AAACGG T G AG AC AC AT AC AG ACAC AC AACCC G AGAG AT AAAG AAAAAAA 
851 GT GC GC T AG CG AGAG ACAC T GGAGAAGAGAC AGAAAC TGACGGTC G TAAA 
901 CAGACAGAAACAGAGAGCGCACGCGCATGCGCTAGCGCTAGCGACCAAAA 
951 CTCCCCGGAGCCAGAGACAGTGTGAGAGACAAGCAGAGAAAGCGCACGCA 
1001 CGCACGCGCCAGCAGGAGAAACAGATGAGAGGAAATCAGAGCCCTGGAGA 
1051 GAGACAGGCAGACAGATCTGGAGAGTCCGGAAAGGAGCCATAGAAGCTGC 
1101 CCGCACTGGGGATGGAGCCGTGCGGAAACCCGGGGTAGGGGGTCCTGCAG 
1151 CGTCCTTGCTGGGCGCGGAGGCTTCTCCCCTTGACGGGTGACTAACTCTG 
1201 CCTGCGTGTTTCTTTTGTCACCAGCATAGGCACTGAGTGCGGTCTGTGCA 
1251 CCCCTTTGCCACCCACCGGTGCCGGCACTGAGCCTGCAACCTGTCTCACG 
1301 CCCTCTGGCTGTTGCCATGACGTCCACCTGCACCAACAGCAQGCGCGAGA 
1351 GTAACAGCAGCCACACGTGCATGCCCCTCTCCAAAATGCCCATCAGCCTG 
14 01 GCCCACGGCATCATCCGCTCAACCGTGCTGGTTATCTTCCTCGCCGCCTC 
14 51 TTTCGTCGGCAACATAGTGCTGGCGCTAGTGTTGCAGCGCAAGCCGCAGC 
1501 TGCTGCAGGTGACCAACCGTTTTATCTTTAACCTCCTCGTCACCGACCTG 
1551 CTGCAGATTTCGCTCGTGGCCCCCTGGGTGGTGGCCACCTCTGTGCCTCT 
1601 CTTCTGGCCCCTCAACAGCCACTTCTGCACGGCCCTGGTTAGCCTCACCC 
1651 ACCTGTTCGCCTTCGCCAGCGTCAACACCATTGTCGTGGTGTCAGTGGAT 
1701 CGCTACTTGTCCATCATCCACCCTCTCTCCTACCCGTCCAAGATGACCCA 
1751 GCGCCGCGGTTACCTGCTCCTCTATGGCACCTGGATTGTGGCCATCCTGC 
1801 AGAGCACTCCTCCACTCTACGGCTGGGGCCAGGCTGCCTTTGATGAGCGC 
1851 AATGCTCTCTGCTCCATGATCTGGGGGGCCAGCCCCAGCTACACTATTCT 
1901 CAGCGTGGTGTCCTTCATCGTCATTCCACTGATTGTCATGATTGCCTGCT 
1951 ACTCCGTGGTGTTCTGTGCAGCCCGGAGGCAGCATGCTCTGCTGTACAAT 
2001 GTCAAGAGACACAGCTTGGAAGTGCGAGTCAAGGACTGTGTGGAGAATGA 
2051 G GAT GAAG AGGGAGC AG AGAAGAAGG AG GAG T T CC AGG AT G AGAGT GAG T 
2101 TTCGCCGCCAGCATGAAGGTGAGGTCAAGGCCAAGGAGGGCAGAATGGAA 
2151 GCCAAGGACGGCAGCCTGAAGGCCAAGGAAGGAAGCACGGGGACCAGTGA 
2201 GAGTAGTGTAGAGGCCAGGGGC AGCGAGGAGGTCAGAGAGAGCAGCACGG 
2251 TGGCCAGCGACGGCAGCATGGAGGGTAAGGAAGGCAGCACCAAAGTTGAG 
2301 GAGAACAGCATGAAGGCAGACAAGGGTCGCACAGAGGTCAACCAGTGCAG 
2351 CATTGACTTGGGTGAAGATGACATGGAGTTTGGTGAAGACGACATCAATT 
2401 TCAGTGAGGATGACGTCGAGGCAGTGAACATCCCGGAGAGCCTCCCACCC 
2451 AGTCGTCGTAACAGCAACAGCAACCCTCCTCTGCCCAGGTGCTACCAGTG 
2501 CAAAGCTGCTAAAGTGATCTTCATCATCATTTTCTCCTATGTGCTATCCC 
2551 TGGGGCCCTACTGCTTTTTAGCAGTCCTGGCCGTGTGGGTGGATGTCGAA 
2601 ACCCAGGTACCCCAGTGGGTGATCACCATAATCATCTGGCTTTTCTTCCT 
2651 GCAGTGCTGCATCCACCCCTATGTCTATGGCTACATGCACAAGACCATTA 
2701 AGAAGGAAATCCAGGACATGCTGAAGAAGTTCTTCTGCAAGGAAAAGCCC 
2751 CCGAAAGAAGATAGCCACCCAGACCTGCCCGGAACAGAGGGTGGGACTGA 
2801 AGGCAAGATTGTCCCTTCCTACGATTCTGCTACTTTTCCTTGAAGTTAGT 
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2851 TCTAAGGCAAACCTTGAACTGTCCATAACACGAGAAACAAGAGGAGATTT 
2901 CTTTTCAATGGACCCACAATTCATTAATGCCAAACCATACCATTTCAGGC 
2951 AAAGGTGTTGCACACACATGCTCTTCACCACAAGGTAGATAAATATATAG 
3001 AAGAGGCAGGAACTGGGGTCTTTCCGTAAAAGCATGGACTTGAGGATTCT 
3051 GACTGAAATTTTCCCCCCAAAGATTATTAGGCTCTACATTTCTTAAAGCA 
3101 ACAAGGGCTATCCATTTTGGACTTGTAGTTGGTATTCTATCTTTTCCAGA 
3151 GCTACAACATGCCAACTTTAGCTCTGAAGGAAAGGGAAGATGATGCTTGT 
3201 GAACTTAAGGACTTTTCGGCCCTCGGGTCGGGAGCTCATGGGCCAGAGCT 
3251 ACAGCTTGTGTTCAACTGAAAGAAAGGCAATGGACCAAATCATTCATGGA 

0 3301 GCCCAAGAAACAGAACCTAATGGACTGATCAACATATGAGCCAAATTCTG 
3351 AACTGAACAGCCCCACAGTCGGGTGCAAAGACTGTTACACAAACTAAAAC 
3401 AAAGGGCCTCCTACAGTTAGAATCTCAAGAAGGTTTCTAGATCCCCTAAA 
34 51 GGGATCCAGAAAAGTAGAAGGACATGTATGAAATGGGAAGCTAGTCCAAG 
3501 GGAAAAG ATTGAGAAAT AACAC AC AT CTGGAG AGCT AAACAGT TG ACT T T 

5 3551 TTTTCCTATAAAATCTTGGGTTTATGCATGGGCTGGAACTGAGGTCATTA 
3601 AGTGTAAATTGTCAATTGACACAAATATTTTCTGTCTCCTGTTTGAATAA 
3651 TAGTGGGGCAGAAATCATGCCACTATTTTACAACTTCCCTTATGTGACTG 
3701 AATTGAGATGCTGGTGGGAATTCTTCAGATCTCTGCCAACACTTCTGTTT 
3751 TCTTTTGGTTTGTTTTTGTCAAATAAGCCTTTTTTAGTCAAACAGTATTT 

0 3801 ACAGAAAAAAAGAAATTCAACTAGAAGTGGCCTAAGTCCTACAAAATTCA 
3851 TGATGTCACTGAGGAATAATTTGTTCATCAGAAATATATTTTGTGTCCAT 
3901 GAGATCATAGACAATAAATGTGATCTCCACATGGGGAGCAAGGAAGGCAG 
3951 AATGAACATTTTTCTTCCTCCAGGCACACCCATGTGTCTTTTCCACCTGT 
4001 GGCTCTCTTTAAAGCTTTTAAGCTCTCTGCAGATGTGAAAGAGAAATATC 

5 4051 AGAGAGTCAGAAATGACAAAGAGGATGATTTCACAATACCTAGAAAACAT 
4101 GTAACCTATTCCAAACAGTCCTAAAATCAGAGCATTCAGATCAGACATAT 
4 151 CCTAATTAATGCTGTTGAAATAAATCACGTTGGGAAAACTTTAACAATAT 
4201 CTAAATTATCCCTAGGGTCAATTCACAGGAACATTCCTCAAATCCCAAAC 
4251 CGCAAAATAA 

0 

MBHB-Rezept-7 : SERALPHA Aminosauresequenz 



10 20 30 40 50 60 

35 1 I I I I I 

1 MTSTCTNSTR ESNSSHTCMP LSKMPISLAH GIIRSTVLVI FLAASFVGNI VLALVLQRKP 
61 QLLQVTNRFI FNLLVTDLLQ ISLVAPWVVA TSVPLFWPLN SHFCTALVSL THLFAFASVN 
121 TIWVSVDRY LSIIHPLSYP SKMTQRRGYL LLYGTWIVAI LQSTPPLYGW GQAAFDERNA 
181 LCSMIWGASP SYTILSVVSF IVIPLIVMIA CYSVVFCAAR RQHALLYNVK RHSLEVRVKD 
40 241 CVENEDEEGA EKKEEFQDES EFRRQHEGEV KAKEGRMEAK DGSLKAKEGS TGTSESSVEA 
301 RGSEEVRESS TVASDGSMEG KEGSTKVEEN SMKADKGRTE VNQCSIDLGE DDMEFGEDDI 
361 NFSEDDVEAV NIPESLPPSR RNSNSNPPLP RCYQCKAAKV IFIIIFSYVL SLGPYCFLAV 
421 LAVWVDVETQ VPQWVITIII WLFFLQCCIH PYVYGYMHKT IKKEIQDMLK KFFCKEKPPK 
4 81 EDSHPDLPGT EGGTEGKIVP SYDSATFP 
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sequence. seq is a single sequence 
Using hydrophobicity file: /home/servers/server/toppreoWlib/Engelman-Steitz. sc 
Using cyt/ext file: /home/servers/server/toppredm/lib/Cyt-Ext . prok 

Using sequence file: sequence. seq 5 
(1 sequences) 

MTSTCTNSTRESNSSHTCMPLSKMPISLAHGIIRSTVLVIFLAAS FVGNI 
VLALVLQRKPQLLQVTNRFIFNLLVTDLLQISLVAPWWATSVPLFWPLN 
SHFCTALVSLTHLFAFASVNTIVWSVDRYLSIIHPLSYPSKMTQRRGYL 

LLYGTWI VAI LQST PPLYGWGQAAFDERNALCSMI WGAS PSYTILSWS F 10 

IVIPLIVMIACYSVVFCAARRQHALLYNVKRHSLEVRVKDCVENEDEEGA 

EKKEEFQDESEFRRQHEGEVKAKEGRMEAKDGSLKAKEGSTGTSESSVEA 

RGS EE VRE S S TV AS DGSMEGKEGSTKVEENSMKADKGRTEVNQCS I DLGE 

DDME FGEDDINFSEDDVEAVNIPESLPPSRRNSNSNPPLPRCYQCKAAKV 

IFIIIFS Y VLSLGPYCFLAVLAVWVDVETQVPQWVI T I I IWLFFLQCCI H 

PYVYGYMHKTIKKEIQDMLKKFFCKEKPPKEDSHPDLPGTEGGTEGKIVP 15 
SYDSATFP 



(p)rokaryotic or (e) ukaryotic: p 
Charge-pair energy: 0 

Length of full window (odd number!): 21 

Length of core window (odd number!): 11 

Number of residues to add to each end of helix: 1 

Critical length: 60 

Upper cutoff for candidates: 1 

Lower cutoff for candidates: 0.6 
Total of 1 structures are to be tested 

Candidate membrane-spanning segments: 



Helix 


Begin 


End 


Score Certainity 


1 


36 


56 


1.964 Certain 


2 


79 


99 


1.652 Certain 


3 


102 


122 


1.564 Certain 


4 


148 


168 


1.264 Certain 


5 


193 


213 


2.320 Certain 


6 


400 


420 


1.879 Certain 


7 


431 


451 


1.854 Certain 
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40 



Structure 1 45 

Transmembrane segments included in this structure: 

Segment 1 2 3 4 5 6 7 

Loop length 35 22 2 25 24 186 10 57 

K+R profile 4.00 0.00 1.00 0.00 

3.00 4.00 + 9.00 50 

CYT-EXT prpf - 

-NaN 

For CYT-EXT profile neg. values indicate cytoplasmic preference. 



K+R difference: -11.00 55 
Tm probability: 1.00 
-> Orientation: N-out 



Patentanspriiche 60 

1. Das dargestellte Gen inclusive des 5' und 3' nichttranslatierten Bereichs 

2. Transkriptionsfaktoren, RNA Polymerasen und Pharmaka sowie Chemikalien die die Expresssion des Gens in 
positiver oder negativer Weise beeinflussen. 

3. Die von dem Gen transkribierte messenger RNA inclusive davon abgeleitete SpleiBvarianten und Isoformen. 65 

4. Die von der mRNA oder von dem intronlosen Gen abgeleitete cDNA. 

5. Das von der mRNA (oder dem Gen oder der cDNA) abgeleitete oder hergestellte Protein. 

6. Antikorper oder Antiseren welche gegen einzelne oder mehrere Epitope des Proteins oder gegen das ganze Pro- 
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tein hergestellt werden^^ 

7. Monoklonale Antikorper oder Antiseren die gegen einzelne oder mehrere Epitope des Proteins oder gegen das 
ganze Protein hergestellt werden. 

8. Expressionssy sterne (eukaryotische Zellinien, Hefezellen, Xenopus Oocyten, Baculovirussysteme, bakterielle 
Expressionssysteme) welche das genannte Protein exprimieren (nativ oder recombinant) 

9. Ligand Bindungsstudien und Screening assays an nativen oder recombinanten Rezeptoren oder Zellen oder Zell- 
membranen welche diesen Rezeptor enthalten. 

10. Transgene Here und knock out Here welche diesen Rezeptor in veranderter Dichte oder gar nicht exprimieren. 

11. Methoden der Gentherapie welche sich auf diesen Rezeptor bzw sein Gen oder seine mRNA (cDNA) erstrek- 
ken und deren Entwicklung und Anwendung. 

12. Sense und Antisense Oligonukleotide welche von diesem Gen abgeleitet wurden sowie deren Anwendung. 

13. Die Diagnose und Behandlung von Krankheiten die mit diesem Rezeptor in direkter oder indirekter Weise in 
Verbindung stehen. 

14. Methoden zur Diagnose von Erkrankungen die mit diesem Rezeptor (oder dessen Gen, mRNA) in direkter oder 
indirekter Weise in Verbindung stehen wie z. B. Hybridisierungstechniken, Sequenzierung, SSCP, RFLP, Northern 
Blot, Southern Blot, Western Blot, Expressions Arrays, Antikorper, Mutationsanalysen. 

15. Die Benutzung der Informationen, oder des Rezeptors oder Zellen welche diesen exprimieren zur Entwicklung 
neuer Pharmaka, Verbindungen und Chemikalien und die Evaluierung vorhandener Pharmaka, Verbindungen und 
Chemikalien sowie zur Entwicklung neuer Technologien oder Evaluierung vorhandener Technologien. 

16. Das Patent soil sich auch erstrecken auf die Punkte 1. bis 15. fur modifizierte Proteine, und Gen, cDNA und 
mRNA Sequenzen (Aminosaureaustausche, Basenaustausche). 
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